3.6.9.1 基本動作について
MAUの演算モードは行列ベクトル積和演算モードとベクトル積和演算モードがあり、精度モードは倍精度、単精度、疑似単精度、半精度がある。
半精度モードでは単精度アキュミュレーションが行われる。
すなわち、積和演算の和の方の入力と出力はいずれも単精度にできる。
行列ベクトル積和演算モードのオペコードは以下である。
mfma : Matrix Fused Multiply-Add(行列積和演算)
3入力で、第 1 入力の行列と第 2 入力のベクトルの行列ベクトル積を行い、第 3 入力のベクトルとの要素ごとの和を取る
mmul : Matrix Multiply(行列積)
2入力で、mfmaの第 3 入力を 0 としたものベクトル積和演算モード
ベクトル積和演算モードのオペコードは以下のとおりである。
vfma : Vector Fused Multiply-Add(ベクトル積和演算)
3入力で、第 1 入力と第 2 入力の要素ごとの積を取り、第 3 入力と要素ごとの和を取る
vmul : Vector Multiply(ベクトル積)
2入力で、vfmaの第 3 入力を 0 としたもの
vadd : Vector Add(ベクトル和)
2入力で、vfmaの第 2 入力を 1 としたもの
vpassa : Vector Pass A(ベクトル通過)
1入力で、vfmaの第 3 入力を 0 、第 2 入力を 1 としたもの
まず、入力符号反転・精度拡張・丸めが起きない場合のmfmaおよびvfmaを基本動作として、各演算モード・精度モードでの基本動作を説明する。